MedCUA-Bench: un benchmark para agentes clínicos de computadora MedCUA-Bench: benchmark interactivo que evalúa agentes de IA en 18 escenarios clínicos. Los mejores modelos apenas alcanzan 54% de éxito. ¿Superarán el reto? 2026-06-03 · 2 min